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Ansprfiche 

1 . Recherchensystem (1 ) zur Ermittlung von Informationen aus einer Daten- 
bank unter Nutzung einer Mehrzahl von Suchmaschinen (2) mit einem Inte- 
grationsmodul (6), das die von den Suchmaschinen (2) gelieferten, jeweils . 
eine Mehrzahl von Ergebnisdatensatzen (E) umfassenden Ergebnisdaten in 
ein gemeinsames Datenformat konvertiert und anschliefcend unter RQckgriff 
auf in einem Speichermodui (8) hinterlegte Priorisierungsparameter (P) je- 
dem Ergebnisdatensatz (E) einen Relevanzkennwert zuordnet. 

2. Recherchensystem (1 ) nach Anspruch 1 , bei dem die Priorisierungsparame- 
ter (P) abhangig von der jeweiligen Suchmaschine (2) gewahlt sind. 

3. Recherchensystem (1) nach Anspruch 1 oder 2, dessen Integrationsmodul 
(6) den Relevanzkennwert fur den jeweiligen Ergebnisdatensatz (E) unter 
BerQcksichtigung eines von der jeweiligen Suchmaschine (2) bereitgestellten 
Ausgangsrelevanzkennwerts ermittelt. 

4. Recherchensystem (1) nach einem der Anspriiche 1 bis 3, dessen Integrati- 
onsmodul (6) uber ein gemeinsames Pufferspeichermodul (12) mit einem Di- 
stributionsmodul (10) kommuniziert, das einen im gemeinsamen Datenfor- 
mat eingehenden Suchauftrag fur jede ausgewahlte Suchmaschine (2) in de- 
ren spezifisches Datenformat umwandelt und anschliefiend an diese ausgibt. 

5. Recherchensystem (1) nach Anspruch 4, dessen Distributi'onsmodul (10) mit 
einem zweiten Speichermodui (14) verbunden ist, in dem Syntaxdaten fur die 
Suchmaschinen (2) hinterlegt sind. 
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v 6. Recherchensystem (1) nach Anspruch 4 oder 5, in dessen Pufferspeicher- 
modul (12) fur einzelne Suchauftriage charakteristische Identifikationsdaten 
hinterlegbar sind. 

7. Recherchensystem (1) nach einem der AnsprQche 4 bis 6, dessen Distributi- 
onsmodul (10) eingangsseitig Qber ein Filtermodul (16) mit einem Ein-/Aus- 
gabemodul (18) verbunden ist. 

8. Recherchensystem (1) nach einem der Anspriiche 4 bis 7, dessen Distributi- 
onsmodul (10) mit dem Integrationsmodul (6) in eine gemeinsame Einheit 
integriert ist. 

9. Recherchensystem (1 ) nach einem der Anspriiche 4 bis 8, bei dem das Di- 
stributions- und das Integrationsmodul (6) datenseitig mit einer Werbemittel- 
datenbank (20) verbunden sind, die als Antwortdatensatz auf eine eingehen- 
de Suchanfrage einen hinsichtlich eines Kennungssignals an die Suchanfra- 
ge angepassten Datensatz liefert. 

10. Verfahren zur Ermittlung von Informationen aus einer Datenbank, insbeson- 
dere aus dem World-Wide-Web, unter Nutzung eines Recherchensystems 

(1) nach einem der Anspriiche 1 bis 9, bei dem die von den Suchmaschinen 

(2) gelieferten, jeweils eine Mehrzahl von Ergebnisdatensatzen (E) umfas- 
senden Ergebnisdaten in ein gemeinsames Datenformat konvertiert werden, 
wobei anschlieUend unter RQckgriff auf in einem Speichermodul (8) hinter- 
legte Priorisierungsparameter (P) jedem Ergebnisdatensatz (E) einen Rele- 
vanzkehnwert zugeordnet wird. 

1 1 . Verfahren nach Anspruch 1 0, bei dem die Priorisierungsparameter (P) ab- 
hangig von der jeweiligen Suchmaschine (2) gewahlt werden. 

12. Verfahren nach Anspruch 1 0 oder 1 1 , bei dem der Relevanzkennwert fQr 
den jeweiligen Ergebnisdatensatz (E) unter BerQcksichtigung eines von der 
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jeweiligen Suchmaschine (2) bereitgestellten Ausgangsrelevanzkennwerts 
ermittelt wird. 

13. Verfahren nach einem der Ansprtiche 10 bis 12, bei dem ein im gemeinsa- 
men Datenformat eingehender Suchauftrag fur jede ausgewahlte Suchma- 
schine (2) in deren spezifisches Datenformat umgewandelt und anschlie- 
Bend an diese ausgegeben wird. 

14. Verfahren nach einem der Anspriiche 10 bis 13, bei dem ein Dber ein Ein- 
/Ausgabemodul (18) vorgegebener Suchauftrag vor seiner weiteren Bear- 
beitung einer Filterung unterzogen wird. 

15. Verfahren nach einem der Anspriiche 10 bis 14, bei dem ein Suchauftrag 
zusatzlich an eine Werbemitteldatenbank (20) ausgegeben wird, wobei ein 
von dieser eingehender Antwortdatensatz mittels eines Kennungssignals der 
jeweiligen Suchanfrage zugeordnet wird. 
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Beschreibung 

Recherchensystem und Verfahren zur Ermittlung von Informationen aus ei 
ner Datenbank, insbesondere aus dem World-Wide-Web 

Die Erfindung bezieht sich auf ein Recherchensystem zur Ermittlung von Informa- 
tionen aus einer Datenbank unter Nutzung einer Mehrzahl von Suchmaschinen. 
Sie betrifft weiter ein Verfahren zur Ermittlung von Informationen aus einer Daten- 
bank, insbesondere aus dem World-Wide-Web, unter Nutzung eines derartigen 
Recherchensystems. 

In komplexen Datenbanken Oder auch im weltumspannenden Computernetz 
(„World-Wide-Web") wird eine enorme Menge an Informationen bereitgehalten, 
die ein Benutzer zu Recherchezwecken mehr oder weniger gezielt abrufen kann. 
Urn dabei Informationen aus der gro&en Informationsmenge heraus gezielt nutz- 
bar machen zu konnen, kommen so genannte Suchmaschinen zum Einsatz, die 
gerade bei der Informationsbeschaffung aus dem World-Wide-Web teilweise er- 
hebliche Verbreitung erfahren haben. Bei derartigen Suchmaschinen wird dem 
Benutzer ublicherweise iiberein EhWAusgabemodul ein Anfragenfenster zur Ver- 
fiigung gestellt, Qber das gezielte Such- oder Recherchebegriffe vorgegeben wer- 
den kOnnen. Anschlieliend durchsucht die Suchmaschine die Informationsbasis 
der Datenbank bzw. des World-Wide-Web nach geeigneten Schlussel- oder Key- 
wortern. Die daraufhin aufgefundenen Antwortdatensatze werden Qblicherweise 
von der jeweiligen Suchmaschine hinsichtlich ihrer Relevanz fur den vorgegebe- 
nen Suchauftrag kategorisiert und dem Benutzer in der Art einer Trefferliste in 
nach ihrer Relevanz geordneter Reihenfolge zur Verfiigung gestellt. 

Zwischenzeitlich haben sich eine Vielzahl derartiger Suchmaschinen etabliert, die 
sich hinsichtlich ihrer Leistungsfahigkeit, Zuverlassigkeit und/oder der berOcksich- 
tigten Informationsbasis in der Art einer thematischen Spezialisierung voneinander 
unterscheiden konnen. Gerade well aber aufgrund der Vielzahl der beispielsweise 
im World-Wide-Web angebotenen Informationen beim Betrieb einer derartigen 
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Suchmaschine eine gewisse Schwerpunktbildung oder Spezialisierung einzelner 
a Suchmaschinen erforderlich sein kann, kann die Qualitat der Suchergebnisse ab- 
hangig von der vorgegebenen Suchanfrage fur einzelne Suchmaschinen in gewis- 
sen Bandbreiten variieren. 

Der Erfindung liegt daher die Aufgabe zugrunde, ein Recherchensystem zur Er- 
mittlung von Informationen aus einer Datenbank, insbesondere aus dem World- 
Wide-Web, anzugeben, das zur Erzielung einer gleichbleibend hohen Recherche- 
qualitat im besonderem Malie zur gemeinsamen und/oder gleichzeitigen Nutzung 
einer Mehrzahl von Suchmaschinen besonders geeignet ist. Des Weiteren soil ein 
Verfahren zur Ermittlung von Informationen aus einer Datenbank, insbesondere 
aus dem World-Wide-Web, unter Nutzung eines derartigen Recherchensystems 
angegeben werden. 

Bezuglich des Recherchensystems wird diese Aufgabe erfindungsgemali gelost 
mit einem Integrationsmodul, das die von den Suchmaschinen gelieferten, jeweils 
eine Mehrzahl von Ergebnisdatensatzen umfassenden Ergebnisdaten in ein ge- 
meinsames Datenformat konvertiert und anschliellend unter Ruckgriff auf in ei- 
nem im Speichermodul hinterlegte Priorisierungsparameter jedem Ergebnisdaten- 
satz einen Relevanzkennwert zuordnet. 

Die Erfindung geht dabei von der Oberlegung aus, dass zur Erreichung gleichblei- 
bend hoher Recherchequalitaten grundsatzlich eine Mehrzahl von altemativen 
Suchmaschinen eingesetzt werden sollte, so dass suchfragenabhangige Quali- 
tatsmangel wechselweise ausgeglichen werden konnen. Gerade beim Einsatz 
einer Mehrzahl von Suchmaschinen fur eine Suchanfrage ist jedoch damitzu 
rechnen, dass eine grolie Vielzahl an Recherchetreffern oder Ergebnisdatensat- 
zen von der Gesamtheit der Suchmaschinen generiert wird. Fur eine benutzer- 
freundliche und gezielte Auswertung dieser Ergebnisse sollte eine alien Ergebnis- 
sen gemeinsame Relevanzkennung vergeben werden, so dass in fUr den Benut- 
zer nachvollziehbarerweise eine systematische Ordnung samtlicher Rechercheer- 
gebnisse nach vorgegebenen Relevanzkriterien erfolgen kann. Insbesondere 
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sollte dabei ermoglicht sein, die nach vorgegebenen Kriterien als relevantest er- 
* achteten Ergebnisse zuerst zu prasentieren, so dass der Benutzer sich auf die 
wesentlichen Rechercheergebnisse konzentrieren kann. Urn dies zu ermSglichen, 
ist zunachst die Konvertierung der eingehenden Datensatze in ein gemeinsames 
Datenformat vorgesehen, so dass eine gemeinsame Datenauswertung und -struk- 
turierung ermoglicht wird. Anschliefiend ist die Gliederung der aufgefundenen Er- 
gebnisdatensatze im Sinne einer gemeinsamen Relevanzstruktur vorgesehen. 
Diese Funktion der ZusammenfQgung und Konsolidierung von Ergebnisdatensat- 
zen aus verschiedenen Quellen wird durch das Integrationsmodul erfQIIt. 

Die hierarchische Kategorisierung der aufgefundenen Ergebnisdatensatze durch 
Zuordnung eines spezifischen Relevanzkennwerts kann dabei nach vom Benutzer 
Oder einem Betreiber vorgegebenen Priorisierungskriterien erfolgen. Insbesondere 
konnte vorgesehen sein, bei der Auswertung der gelieferten Ergebnisse bestimm- 
ten Suchmaschinen generell und standard isiert eine erhShte Relevanz zuzuord- 
nen, beispielsweise weil fur einen bestimmten Typus einer Suchanfrage bekannt 
ist, dass bestimmte Suchmaschinen in der Regel vergleichsweise hohe Recher- 
chequalitat liefern. Urn dies zu ermoglichen, sind die Priorisierungsparameter vor- 
teilhafterweise abhangig von der jeweiligen Suchmaschine gewahlt, so dass bei- 
spielsweise anhand des fur eine bestimmte Suchmaschine hinterlegten Priorisie- 
rungskennwerts festgestellt werden kann, dass ein von dieser Suchmaschine ge- 
lieferter Ergebnisdatensatz mit einem vergleichsweise hohen Relevanzkennwert 
versehen wird. 

Die Vorgabe einer spezifischen Priorisierung bei der BerQcksichtigung der Such- 
maschinen kann dabei vom Benutzer nach Art und Umfang vorgegeben sein. In- 
nerhalb der von einer Suchmaschine gelieferten Ergebnisdatensatze kann die so 
genannte interne Priorisierung anschlieBend auf der Grundlage der von der Such- 
maschine bereits gelieferten Priorisierung erfolgen. Dazu wird in weiterer oder al- 
ternativer vorteilhafter Ausgestaltung der Relevanzkennwert fur den jeweiligen 
Ergebnisdatensatz unter BerQcksichtigung eines von der jeweiligen Suchmaschine 
bereitgestellten Ausgangsrelevanzkennwerts vom Integrationsmodul ermittelt. 
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- Dabei kann insbesondere in der Art einer „dynamischen Priorisierung" eine Nor- 
malisierung von den jeweiligen Suchmaschinen bereits mitgelieferter Ausgangs- 
relevanzkennwerte vorgesehen sein, bei der der von der jeweiligen Suchmaschine 
als relevantest angesehene Ergebnisdatensatz mit einem voriaufigen Relevanz- 
kennwert von beispielsweise 100 % versehen wird, wobei die von der jeweiligen 
Suchmaschine bereits als vergleichsweise weniger relevant eingestuften weiteren 
Ergebnisdatensatze mit einem entsprechend abgestuften Relevanzkennwert ver- 
sehen werden. Bei dieser Art der Auswertung und Priorisierung ist somit in der Art 
einer Gleichberechtigung samtlicher eingesetzter Suchmaschinen ein direkter 
Quervergleich einzelner Ergebnisdatensatze ermoglicht. Zusatzlich Oder alternativ 
kann aber auch vorgesehen sein, dass bereits bei der Normalisierung, also bei 
der Bildung der BezugsgroRe fur den von der jeweiligen Suchmaschine als rele- 
vantest angesehenen Ergebnisdatensatz, ein suchmaschinenspezifischer Kenn- 
wert mit vorgegeben wird, durch den der Relevanzkennwert des von der jeweiligen 
Suchmaschine als relevantest angesehenen Ergebnisdatensatzes suchmaschi- 
nenspezifisch vorgegeben wird. Durch eine derartige suchmaschinenspezifische 
Vorgabe sind somit Relativwichtungen zwischen einzelnen Suchmaschinen mog- 
lich, in die insbesondere auch Erfahrungswerte Qber die generelle Zuverlassigkeit 
der jeweiligen Suchmaschine und/oder auch themen- oder suchanfragenabhangi- 
ge Erkenntnisse uber die jeweilige Suchmaschine mit einflielien konnen. 

Das Integrationsmodul ist zur gemeinsamen Auswertung der von den verschiede- 
nen Suchmaschinen gelieferten Ergebnisdatensatzen ausgelegt, wobei zunachst 
eine Konvertierung der einzelnen Ergebnisdatensatze in ein gemeinsames und 
somit gemeinsam auswertbares Datenformat vorgesehen ist. Dazu ist das Inte- 
grationsmodul dafur ausgelegt, die spezifische, von der jeweiligen Suchmaschine 
eingesetzte Syntax oder deren Datenformat auswerten und gegebenenfalls urn- 
wandeln zu konnen. Urn dies zu ermdglichen, ist das Integrationsmodul vorteil- 
hafterweise mit einem zweiten Speichermodul verbunden, in dem Syntaxdaten fur 
die einzelnen Suchmaschinen hinterlegt sind. Anhand dieser Syntaxdaten kann 
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sodann die suchmaschinenspezifische Datenkonvertierung vorgenommen wer- 
* den. 

In.weiterervorteilhafter Ausgestaltung ist zusatzlich zum Integrationsmodul auch 
ein Distributionsmodul vorgesehen, das einen im gemeinsamen Datenformat ein- 
gehenden Suchauftrag geeignet auf die einzelnen zum Einsatz vorgesehenen 
Suchmaschinen aufteilt. Dazu ist das Distributionsmodul, das zweckmafiigerweise 
Qber ein gemeinsames Pufferspeichermodul mit dem Integrationsmodul kommu- 
niziert, vorteilhafterweise dafiir ausgelegt, den jeweiligen Suchauftrag geeignet in 
eine fur die jeweilige Suchmaschine verarbeitbare Syntax Oder ein entsprechen- 
des Datenformat umzuwandeln. 

Urn eine zuvenassige Zuordnung der gelieferten Ergebnisse zum jeweiligen Such- 
auftrag auch dann zu ermoglichen, wenn in enger zeitlicher Reihenfolge eine ver- 
gleichsweise grofte Vielzahl an Suchauftragen zu bearbeiten ist, was insbesonde- 
re bei unterschiedlichen Reaktionszeiten der Suchmaschine zu unterschiedlichen 
Wartezeiten auf die Ergebnisse und somit zu zeitlichem Oberlapp zwischen ver- 
schiedenen Suchauftragen fiihren konnte, ist dem Integrationsmodul und dem 
Distributionsmodul vorteilhafterweise ein gemeinsames Pufferspeichermodul zu- 
geordnet. Im Pufferspeichermodul werden zweckmSIJigerweise fur jeden Such- 
auftrag charakteristische Identifikationsdaten, beispielsweise eine Identifikations- 
kennummer, hinterlegt, wobei die einzelnen, an die Suchmaschinen direkt ausge- 
gebenen spezifizierten Suchauftrage mit einer entsprechenden Kennnummer ver- 
sehen sind. Bei den von den Suchmaschinen gelieferten Antworten ist dann im 
Integrationsmodul durch einen ROckgriff auf die im Pufferspeicher hinterlegten 
charakteristischen Identifikationsdaten eine eindeutige Zuordnung der Ergebnis- 
datensatze zum jeweiligen Suchauftrag ermoglicht, so dass eine konsolidierte und 
konsistente Auswertung der eingehenden Ergebnisse ermoglicht ist. 

Das Distributionsmodul ist vorteilhafterweise spezifisch dafQr ausgelegt, den ein- 
gehenden Suchauftrag datenseitig in eine fur die jeweiligen Suchmaschinen ver- 
arbeitbares Datenformat oder eine Syntax zu konvertieren. Dazu ist auch das Di- 
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stributionsmodul vorteilhafterweise mit dem zweiten Speichermodul verbunden, in 
dem Syntaxdaten fQr die Suchmaschinen hinterlegt sind. Durch gezielte Wartung 
und Pflege des zweiten Speichermoduls ist somit auf besondere Weise ermog- 
licht, gegebenenfalls Aktualisierungen der von den Suchmaschinen verwendeten 
Syntax oder auch die Hinzufiigung oder Loschung vollstandiger Suchmaschinen 
auf besonders einfache Weise vorzunehmen. 

In weiterer vorteilhafter Ausgestaltung ist das Distributionsmodul eingangsseitig 
fiber ein Filtermodul mit einem EiiWAusgabemodul verbunden, Ober das vom Be- 
nutzer einzelne Suchauftrage vorgebbar sind. Das Filtermodul kann dabei insbe- 
sondere dafur ausgelegt sein, anhand einstellbarer oder individuell vorgebbarer 
Filterkriterien bestimmte Suchanfragen ganz zu unterdrucken oder beispielsweise 
lander- oder kundenspezifische Individualvorgaben hinzuzufiigen. Dabei kann 
insbesondere auch vorgesehen sein, anhand der Art der Anfrage gezielt einzelne, 
als besonders geeignet erkannte Suchmaschinen fUr die nachfolgende Bearbei- 
tung des Suchauftrags vorzugeben. Das Filtermodul kann somit insbesondere 
auch dafur ausgelegt sein, abhangig von der jeweiligen Suchanfrage oder von de- 
ren thematischem Schwerpunkt eine Vor- oder Grobauswahl der einzusetzenden 
Suchmaschinen zu treffen und somit eine Grobstrategie fQr die nachfolgende 
Strategie vorzugeben. 

Grundsatzlich konnen das Distributionsmodul und das Integrationsmodul als ei- 
genstandige Einheiten, beispielsweise auf Software- oder auf Hardwarebasis, 
ausgefQhrt sein. Eine besonders kompakte und somit gunstige Bauweise ist dabei 
erreichbar, indem das Distributionsmodul vorteilhafterweise mit dem Integrations- 
modul in eine gemeinsame Einheit integriert ist. 

Es ist weit verbreitete Praxis, gerade bei der DurchfQhrung von Recherchen im 
Internet oder World-Wide-Web, dass dem Benutzer gemeinsam mit den auf seine 
Suchanfrage hin generierten Trefferlisten Werbeanzeigen, so genannte „Ban- 
ners", mit angezeigt werden. Dabei werden in Reaktion auf eine Suchanfrage von 
einem auch als „Ad-Server" bezeichneten Werbemitteldatenbank gemeinsam mit 
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den Ergebnissen zufallig aus den dort hinterlegten Banners ausgewahlte Daten- 
- satze mit Obermittelt, die anschliefcend auf dem Ein-/Ausgabemodul zur Anzeige 
gebracht werden. Bei einem derartigen System erfolgt die HinzufGgung der indivi- 
duellen Banners jedoch ublicherweise unspezifiziert und insbesondere ohne Be- 
zug auf das vom Benutzer durch die Suchanfrage vorgegebene Thema, so dass 
das Benutzerinteresse am jeweiligen Werbemittel nur vergleichsweise gering ist. 
In besonders vorteilhafter Weiterbildung des oben genannten Systems sind je- 
doch nunmehr das Distributions- und das Integrationsmodul datenseitig mit einer 
Werbemitteldatenbank verbunden, die als Antwortdatensatz auf eine eingehende 
Suchanfrage einen hinsichtlich eines Kennungssignals an die Suchanfrage ange- 
passten Datensatz liefert. Mit anderen Worten: Aufgrund der ohnehin vorgesehe- 
nen, vergleichsweise qualifizierten Auswertung der vorgegebenen Suchanfrage, 
die Clber die entsprechende Konvertierung im Distributionsmodul ermSglicht wird, 
ist nunmehr die Erzeugung einer beispielsweise inhalts- oder themenbezogenen 
Kennung fur die Suchanfrage ermoglicht, die bei einer Weiterleitung der Suchan- 
frage auf die Werbemitteldatenbank eine gezielte Selektion von hinsichtlich des 
Kennungssignals, also beispielsweise hinsichtlich des bearbeiteten Themas, be- 
sonders geeigneten Werbedatensatzes ermoglicht. Durch eine derartige gezielte 
Zuordnung der als Antwortsignal mitgegebenen Werbemitteldatensatze ist somit 
eine deutlich erhohte Aufmerksamkeit beim Benutzer gegenQber der eingesetzten 
Werbemittel erreichbar. 



BezDglich des Verfahrens wird die genannte Aufgabe unter Nutzung des genann- 
ten Recherchensystems gelost, indem die von den Suchmaschinen gelieferten, 
jeweils eine Mehrzahl von Ergebnisdatensatzen umfassenden Ergebnisdaten in 
ein gemeinsames Datenformat konvertiert werden, wobei anschliefcend unter 
RQckgriff auf in einem Speichermodul hinterlegte Priorisierungsparameter jedem 
Ergebnisdatensatz ein Relevanzkennwert zugeordnet wird. Oberdas Integrations- 
modul ist somit vorgesehen, fur die gelieferten Ergebnisdatensatze ein konsoli- 
diertes und konsistentes Relevanzsystem zu erzeugen, in dem die einzelnen Er- 
gebnisdatensatze relativ zueinander im Hinblick auf vorgegebene Relevanzkriteri- 
en geeignet positioniert sind. 
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Vorteilhafterweise werden die Priorisierungsparameter dabei abhangig von der 
jeweiligen Suchmaschine gewahlt, wobei der Relevanzkennwert in alternativer 
oder zusatzlicher vorteilhafter Weiterbildung fur den jeweiligen Ergebnisdatensatz 
unter BerOcksichtigung eines von der jeweiligen Suchmaschine bereitgestellten 
Ausgangsrelevanzkennwerts ermittelt wird. 

Vorteilhafterweise wird ein im gemeinsamen Datenformat eingehender Suchauf- 
trag fur jede ausgewahlte Suchmaschine in deren spezifisches Datenformat um- 
gewandelt und anschlieftend an diese ausgegeben. In alternativer oder zusatzli- 
cher vorteilhafter Ausgestaltung wird ein Qber ein Ein-/Ausgabemodul vorgegebe- 
ner Suchauftrag vor seiner weiteren Bearbeitung einer Filterung unterzogen. 

Vorteilhafterweise wird ein Suchauftrag zusatzlich zu den Suchmaschinen an eine 
Werbemitteldatenbank ausgegeben, wobei ein von dieser eingehender Antwort- 
datensatz mittels eines Kennungssignals der jeweiligen Suchanfrage zugeordnet 
wird. Durch das Kennungssignal ist dabei insbesondere ermSglicht, den Antwort- 
datensatz hinsichtlich vorgebbarer Kriterien, beispielsweise hinsichtlich verwen- 
deter Inhalte oderThemen, an die jeweilige Suchanfrage anzupassen, so dass im 
Ergebnis dem Benutzer gemeinsam mit seinen Suchergebnissen ein thematisch 
zur Suchanfrage passender Werbetrager angeboten wird. 

Die mit der Erfindung erzielten Vorteile bestehen insbesondere darin, dass durch 
die Verwendung des Integrationsmoduls, dass eingehende Ergebnisdatensatze 
auf ein gemeinsames Datenformat konvertiert und anschlieftend eine relative Ge- 
wichtung und Priorisierung der Ergebnisdatensatze untereinander durch Vergabe 
eines „globalen" Relevanzkennwerts eine konsistente gemeinsame Nutzung einer 
Mehrzahl von Suchmaschinen ermOglicht ist. Durch das mit dem Integrationsmo- 
dul kommunizierende Distributionsmodul ist weiterhin gewahrleistet, dass unter 
RQckgriff auf im Speichermodul hinterlegte, suchmaschinenspezifische Daten wie 
beispielsweise Syntaxdaten eine gezielte Ansprache verschiedenartiger Suchma- 
schinen mit einer gemeinsamen Suchanfrage ermdglicht ist, wobei ebenso eine 
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konsolidierte gemeinsame Auswertung der von den angesprochenen Suchma- 
schinen gelieferten Ergebnisse unter Berucksichtigung von deren spezifischer 
Syntax ermoglicht ist. 

Ein Ausfuhrungsbeispiel der Erfindung wird anhand einer Zeicbnung naher eriau- 
tert. Darin zeigen: 



Fig. 1 schematisch ein Recherchensystem zur Ermittlung von Informatio- 

nen aus einer Datenbank, 

Fig. 2 eine konzeptionelle Darstellung des Recherchensystems nach Fig. 1, 

Fig. 3 eine schematische Aufstellung der im Recherchensystem nach 

Fig. 1 ablaufenden Prozesse, 

Fig. 4 eine alternative Darstellung fOr das Gesamtsystem nach Fig, 1, 

Fig. 5 schematisch die Struktur der Administration des Recherchensystems 

nach Fig. 1 , 

Fig. 6 ein Schema fur eine Antrage an eine Mehrzahl von Suchmaschinen, 

Fig. 7 , ein Schema fur eine verteilte Abfrage und ZusammenfQhrung der 
Ergebnisse, 

Fig. 8 ein Schema fQr verschiedene Suchmodi im Recherchensystem nach 

Fig. 1, 

Fig. 9 ein Schema fQr eine Filterung von Suchanfragen, 

Fig. 10 eine schematische Darstellung der im Recherchensystem nach 
Fig. 1 verwendeten Module, 
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17 

18 



Seite 



2 * Fig. 1 1 schematised eine Darstellung der Struktur eines Filter- 

3 /Interpretermoduls, 



5 . Fig. 1 2 schematisch eine Struktur eines Integrationsmoduls, 

6 

7 Fig. 13 schematisch die Struktur eines Server-Engine-Moduls, 

8 

9 Fig. 14' schematisch ein dynamisches Model fur einen Suchprozess, 

0 

^ Fig. 1 5 ein Ablaufschema fQr eine Initialisierung einer Server-Engine, 

13 Fig. 1 6 ein Ablaufschema fur die Bearbeitung einer Suchanfrage, 



is Fig. 1 7 ein Ablaufschema fur die Vorbereitung von Adaptern fur eine 
16 Suchanfrage, und 



Fig. 18 ein Schema fur eine Admin-Anwendung des Recherchensystems 



19 nach Fig. 1 . 

20 
21 



22 

24 
25 



Das Recherchensystem 1 gemaft Fig. 1 ist zur Ermittlung von Informationen aus 
einer komplexen Datenbank, insbesondere aus dem Internet, dem World-Wide- 
Web Oder einem anderen Index, mit besonders hoher Recherchenqualitat ausge- 
legt. Dazu ist das Recherchensystem 1 datenseitig mit einer Mehrzahl von Such- 
maschinen 2 verbunden, wie die derzeit zur gezielten Durchsuchung des Internets 



26 weit verbreitet im Einsatz sind. 

27 
28 



29 
30 
31 
32 



Urn dabei den gleichzeitigen und gemeinsamen Einsatz einer Mehrzahl von Such- 
maschinen 2 zu ermoglichen, umfasstdas Recherchensystem 1 in einer zentralen 
Auswerteeinheit 4 ein Integrationsmodul 6, dem die von den Suchmaschinen 2 
gelieferten Trefferlisten oder Ergebnisdaten in Form von Ergebnisdatensatzen E 
zufiihrbar sind. Das Integrationsmodul 6 stellt dabei sicher, dass eine gemeinsa- 
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me, konsistent priorisierte Auswertung der von den verschiedenen Suchmaschi- 
- nen 2 gelieferten Ergebnisdatensatze E ermoglicht ist. 

Dazu ist das Integrationsmodul 6 dazu ausgelegt, die eintreffende Ergebnisdaten- 
satze E zunachst in ein gemeinsames Datenformat zu konvertieren, so dass eine 
konsolidierte Auswertung ermoglicht ist. Urn dem Benutzer dabei eine gezielte 
Auswertung der moglicherweise grofcen Anzahl von Informationen zu ermogli- 
chen, ist die konsolidierte Priorisierung und Relevanzkennung der einzelnen Er- 
gebnisdatensatze E vorgesehen, wobei nach vorgegebenen Relevanzkriterien 
sSmtlichen Ergebnisdatensatzen E untereinander vergleichbare Relevanzkenn- 
werte zugeordnet werden. Urn dies zu ermoglichen, ist das Integrationsmodul 6 
mit einem Speichermodul 8 verbunden, in dem fur die Zuweisung der Relevanz- 
kennwerte relevante Priorisierungsparameter P hinterlegt sind. 

Bei der Priorisierung kann insbesondere vorgesehen sein, die nach Vorgabe 
durch einen Benutzer Oder durch einen Betreiber ausgewahlte Suchmaschinen 2 
grundsStzlich mit einer vergleichsweise hohen Priorisierung und somit einem ver- 
gleichsweise hohen Relevanzkennwert zu versehen. In diesem Fall erfolgt die 
Wahl der Priorisierungsparameter abhangig von der jeweiligen Suchmaschine 2. 
Altemativ Oder zusatzlich kann vorgesehen sein, in der Art einer Normalisierung 
die von einer Suchmaschine 2 gelieferten Ergebnisdatensatze E hinsichtlich ihres 
Relevanzkennwerts zunSchst auf denjenigen Ergebnisdatensatz E zu normieren, 
der bereits von der jeweiligen Suchmaschine 2 aus mit dem hochsten Relevanz- 
kennwert versehen wurde. In der Art einer prozentualen Darstellung kdnnte dies 
somit bedeuten, dass der von der jeweiligen Suchmaschine 2 als am relevante- 
sten erkannte Ergebnisdatensatz E mit einem vorlaufigen Relevanzkennwert von 
100 % versehen wird, wobei die anderen Ergebnisdatensatze E dieser Suchma- 
schine 2 entsprechend ihrem von der Suchmaschine 2 zugewiesenen Aus- 
gangsrelevanzkennwert einen entsprechend abgestaffelten Relevanzkennwert 
erhalten. Wenn dies fur samtliche Suchmaschinen 2 gleichgewichtig durchgefGhrt 
wird, erfolgt somit eine relative Priorisierung der Ergebnisdatensatze E unter- 
schiedlicher Suchmaschinen 2 im Wesentlichen anhand ihrer relativen Relevanz 
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im Hinblick auf den von der jeweiligen Suchmaschine 2 als am relevantesten ein- 
- gestuften Ergebnisdatensatz E. 

Zusatzlich kann bei den Priorisierungsparametern P aber auch ein suchmaschi- 
nenspeziflscher Kennwert hinterlegt sein, der allgemein oder abhangig von der 
jeweiligen Suchanfrage der jeweiligen Suchmaschine 2 einen Veriasslichkeits- 
kennwert zuordnet. 

Die Auswerteeinheit 4 umfasst weiterhin ein Distributionsmodul 10, das Qber einen 
Pufferspeicher 12 mitdem Integrationsmodul 6 kommuniziert. Das Distributions- 
modul 10 ist weiterhin mit einem zweiten Speichermodul 14 verbunden, in dem fur 
die Suchmaschinen 2 charakteristische Datensatze, insbesondere charakteristisch 
fur deren Datenformat oder Syntax, hinterlegt sind. Eingangsseitig ist das Distri- 
butionsmodul 10 Qber ein Filtermodul 16 mit einem Ein-/Ausgabemodul 18 ver- 
bunden, das seinerseits eingangsseitig mit dem Integrationsmodul 6 verbunden 
ist. Das Ein-/Ausgabemodul 18 kann dabei insbesondere als herk6mmliche Be- 
dieneinheit, umfassend eine Tastatur und ein Ausgabemittel wie einen Bildschirm, 
ausgestaltet sein. 

Bei der Bearbeitung einer vom Benutzer fiber das Ein-/Ausgabemodul 18 vorge- 
gebenen Suchanfrage erfolgt zunachst eine Filterung dieser Anfrage im Filterbau- 
stein 16. Dabei kann beispielsweise die Eliminination von Suchanfragen eines 
bestimmten Kriterium vorgesehen sein oderes konnen beispielsweise lander- 
oder regionenspezifische Vorgaben fUr die Bearbeitung der Suchanfrage beriick- 
sichtigt werden. Des Weiteren erfolgt im Filtermodul 16 eine Vorauswahl der fUr 
die jeweiligen Suchanfragen als geeignet erkannten Suchmaschinen 2, so dass 
das Filtermodul 16 in der Art einer Grobstrategie bereits die mit der Suchanfrage 
endgiiltig zu betrauenden Suchmaschinen 2 mit vorgibt. 

Die solchermalien gefilterte Suchanfrage 2 wird anschlieGend dem Distributions- 
modul 10 zugefOhrt, das unter Ruckgriff auf die im zweiten Speichermodul hinter- 
legten suchmaschinenspezifischen Informationen und insbesondere Syntaxkenn- 
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werte die jeweilige Suchanfrage in eine Vielzahl individualisierter Suchanfragen in 
- den fQrdie ausgewahlten Suchmaschinen 2 passenden Datenformate umsetzt. 
Anschlieftend gibt das Distributionsmodul 10 die individualisierten Suchanfragen 
an die ausgewahlten Suchmaschinen 2 weiter, wobei in der Art einer Protokollie- 
rung und zur Verwaltungserieichterung im Pufferspeicher 12 ein Profil der Such- 
anfrage gemeinsam mit einer diese identifizierenden Kennung hinterlegt wird. 

Die durch die Zufuhrung der individualisierten Suchanfrage gestarteten Suchma- 
schinen 2 absolvieren anschlieftend ihr Suchprogramm im World-Wide-Web und 
stellen ihre Antwortsignale, beispielsweise in Form von Trefferlisten, in denen die 
aufgefundenen Ergebnisdaten als Ergebnisdatensatze E nach der durch die je- 
weilige Suchmaschine 2 erkannten Relevanz geordnet aufgelistet sind. Anhand 
der charakteristischen Identifikationsdaten fur die jeweilige Suchanfrage werden 
die Ergebnisdatensatze E sodann im Integrationsmodul 6 der jeweiligen Suchan- 
frage wieder zugeordnet, so dass eine gezielte Auswertung auch bei zeitlich sich 
Qberschneidenden Suchvorgangen ermoglicht ist. 

Im Integrationsmodul 6 erfolgt zudem, gegebenenfalls ebenfalls unter Ruckgriff 
auf die im zweiten Speichermodul 14 hinterlegten Syntaxinformationen, eine Kon- 
vertierung der Ergebnisdatensatze E in das gemeinsame Datenformat. Anschlie- 
liend erfolgt unter Ruckgriff auf die im Speichermodul 8 hinterlegten Priorisie- 
rungsparameter P die Erzeugung eines Relevanzkennwerts fur jeden Ergebnis- 
datensatz E, wobei die solchermafien erzeugten Relevanzkennwerte dazu dienen 
sollen, eine konsolidierte und konsistente Ergebnishierarchie zwischen den Er- 
gebnisdatensatzen E herzustellen. Im Ergebnis wird somit dem Benutzer eine 
homogenisierte Ergebnis- Oder Trefferliste erzeugt, bei der die als relevantest er- 
kannten Ergebnisdatensatze E zuerst gelistet sind. Die Zuordnung des jeweiligen 
Relevanzkennwerts unter Ruckgriff auf die Priorisierungsparameter P kann dabei 
insbesondere im Hinblick auf die jeweilige Suchmaschine 2 erfolgen, die den be- 
troffenen Ergebnisdatensatz E geliefert hat. Altemativ oder zusatzlich kann bei der 
Zuordnung des Relevanzkennwerts auch ein von der jeweiligen Suchmaschine 2 
bereitgestellter Ausgangsrelevanzkennwert mit bertlcksichtigt werden. 
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* Zusatzlich zu den Suchmaschinen 2 ist das Recherchensystem 1 datenseitig mit 
einer Werbemitteldatenbank 20 verbunden. In der Werbemitteldatenbank, auch 
als „Ad-Server" bezeichnet, sind in Form von so genannten ..Banners" Werbeele- 
mente hinterlegt, die von der Werbemitteldatenbank 20 in Reaktion auf eine ein- 
gehende Suchanfrage an das Recherchensystem 1 zurQckgeliefert werden. Das 
Recherchensystem 1 ist dabei derart ausgestaltet. dass die Werbemitteldaten- 
bank 20 ausgewahlte und spezifizierte Werbeelemente als Antwortdatensatz auf 
eine eingehende Suchanfrage zurucksendet. wobei die Auswahl und Spezifikation 
inhalts- oder themenbezogen angepasst an die jeweilige Suchanfrage erfolgt. Die 
Auswahl derzuriickgesandten Werbeelemente erfolgt dabei dahingehend, dass 
das jeweilige Werbeelement inhaltlich oder thematisch einen Bezug zur Suchan- 
frage aufweist, so dass mit einem vergleichsweise erhOhtem Interesse des Benut- 
zers an dem jeweiligen Werbeelement gerechnet werden kann. Zu diesem Zweck 
Obermitteltdas Recherchensystem 1 die jeweilige Suchanfrage gemeinsam mit 
einem Kennungssignal an die Werbemitteldatenbank 20, wobei anhand des mit- 
gelieferten Kennungssignals die Auswahl moglicherweise fur den Antwortdaten- 
satz geeigneter Werbeelemente vorgenommen wird. 

Fig. 2 verdeutlicht die beteiligten Komponenten und Aktoren im Bezug auf die 
(Sub)Systemgrenzen. 



Rollenbeschreibung 
Kunde 

„Kunde" ist jeder Benutzer, der eine Suchanfrage starten kann. 



TSC Filtermanager 

Die Rolle „TSC Filtermanager beschreibt den Mitarbeiterkreis, in dessen Verant- 
wortungsbereich die Filterdefinitionen liegen. Dieser Mitarbeiterkreis wertet auBer- 
dem die Statistikprotokollierung des Recherchensystems aus. 
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2 TSC Admin 

3 Die Rolle des .Admin" beschreibt den Mitarbeiterkreis, der fur den Betrieb des Re- 

4 cherchensystems verantwortlich ist. 

s Er administriert die Konfigurationsdatei (tsc.cfg) des Recherchensystems und 

e uberwacht die Fehlerprotokolle (tsc_error.log). 

7 

a Beschreibung der externen Systeme 

9 Inhalte 

Kurzbeschreibung 

11 Hier werden Suchergebnisse bereitgestellt, die auf private und Business-Homepa- 

12 ges zeigen. 

13 Schnittstelle 

14 Die Schnittstelle ist analog zur WWW-Suche mit Fast. 

is P4P-Server 

is Kurzbeschreibung 

17 Die Suchergebnisse des Pay4Performance(P4P)-Servers werden hier bereitge- 

18 stellt. 

19 Schnittstelle 

Die Schnittstelle des GoTo-Suchcenters wird per HTTP-Request (inklusive Para- 

21 meter) angesprochen. Die Ergebnisse werden in XML-Format geliefert. 

22 FAST Suchcenter 

23 

24 Kurzbeschreibung 

2s Hier werden internet-weite Suchergebnisse bereitgestellt, die mittels der Suchma- 

26 schine „AIITheWeb" gefunden wurden. 

27 

28 Schnittstelle 
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Die Schnittstelle des FAST-Suchcenters wird per HTTP-Request (inklusive Para- 
meter) angesprochen. Die Ergebnisse werden in XML-Format geliefert. 

Ad-Server 

Kurzbeschreibung 

Der Ad-Server liefert entsprechend der Suchanfrage eine Werbe-Komponente, die 
in die Gesamtdarstellung der Suchergebnisse einfiielit. 

Recherchensystem Prozesse 

In Fig. 3 werden die Prozesse des Recherchensystem in der Obersicht dargestellt 
und der Prozessdurchlauf im „Gut"-Fall beschrieben. 

TSC Konfiguration 

Die Konfiguration des Recherchensystem wird uber Parameter gesteuert, die in 
einer eigenen Datei abgelegt sind. Diese Konfigurationsdatei wird im XML-Format 
im Dateisystem des Suchcenters abgelegt. Sie kann mit Hilfe eines Standard-Edi- 
tors bearbeitet werden. 

Die geanderte Konfiguration kann nur mit Hilfe des Restarts der „TSC Suche" Pro- 
zesse erreicht werden. 



Der Prozess „TSC Konfiguration" beschreibt die notwendigen Arbeitsschritte fur 
die Administration der Konfigurationsdatei des Recherchensystem. 



Rolle 


Aktivitaten 


TSC Admin 


1 . Konfiguration (tsc.cfg) editieren 

2. Konfiguration (tsc.cfg) auf alle Produktionssysteme verteilen 

3. „TSC Restart" Prozess durchfUhren 
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TSC Ausschlussfilter pflegen 

Die TSC Ausschlussfilter definieren Worte und Phrasen fOr die ein Suchstring, 
wenn sie in diesem enthalten sind, fur bestimmte Kanale gesperrt wird. Diese 
Sperruhgen sind landesspezifisch und konnen zeitabhangig definiert werden. 
Gewohnlich werden die Filter mit Hilfe einer eigenen Anwendung (der TSC Admin 
Anwendung) gepflegt. Letztendlich ist die Datei der TSC Ausschlussfilter das Pro- 
dukt eines Exports aus der „Filter DB" und liegt im CSV-Format vor. Diese Datei 
kann ggf. mit einem Standardeditor bearbeitet werden. 

Die Aktivierung der geanderten Filter kann nur mit Hilfe des Restart der „TSC Su- 
che" Prozesse erreicht. 

Folgende Arbeitsschritte werden fur den Prozess „TSC Ausschlussfilter pflegen" 
definiert: 



Rolle 



Aktivitaten 



CD 
D) 
CO 
C 

to 

I 



O 

P 



1 . Ahmelden an der Anwendung „TSC Admin" 

2. Moglichkeit zur Ausfiihrung folgender Aktionen: 

a. Filter Aktivieren 

b. Filter Erstellen 

c. Filter Andern 

d. Filter L6schen 

3. Aktivierung der geanderten Filter 

a. Filterdatei (tsc_filter_table) aus ..Filter DB" generieren 

b. Filterdatei (tsc_filter_table) auf alle Produktionssysteme 
verteilen 

c. ..Sukzessive" Neustart der „TSC Suche" Prozesse 



TSC Restart 

Der „TSC Restart" Prozess kann manuell oder automatisch durch andere Skripte, 
wie z. B. im Kontext der Filteraktivierung, gestartet werden. 
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Rolle 


Aktivitaten 


TSC Admin, 
TSC Filtermanager 


1 . tsc_restart.sh starten 

a. Starten des tsc_restart.sh auf alien Produktionssystemen 

i. Ermitteln der PIDs aller Prozesse „TSC Suche" 

ii. Sukzessive, zeitversetztes Senden des kill Signals an 
alle Prozesse 



Die „fast-cgi" Umgebung des Apache Web-Servers sorgt automatisch fQr das Neu- 
starten der vorkonfigurierten Anzahl „TSC Suche" Prozesse. 



TSC Suchanfrage bearbeiten 

Der Prozess „TSC Suchanfrage bearbeiten" ist derzentrale Prozess, der durch 
das Recherchensystem realisiert wird. 

Der folgende Ablauf skizziert diesen Prozesses auf hoher Ebene. Detailliert wird 
dieser Ablauf spacer im Dokument. 



Rolle 


Aktivitaten 


Kunde 


1 . Suche eingeben und abschicken 


TSC Server 
Engine 


2. Suchanfrage entgegennehmen 

3. Suchstring lesen 

4. Attribute der Suchanfrage lesen 


BRISBANE- 
Interpreter 


5. Suchstring in elementare Bestandteile zerlegen 

6. Stopp-Wort-Filterung durchfQhren 

7. Suchstring fur die verschiedenen KanSle aufbereiten 
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Rolle 


Aktivitaten 


BRISBANE- 
Integrator 


8. Suchanfrage je ..Server" starten 

9. Warten auf alle Ergebnisse der Suchanfrage (ggf. Timeout) 

10. Transformation der Ergebnisse (-> XML) 

1 1 . Protokollierung der Statistikinformationen 


TSC 
Server 

Fnninfi 


12.Ergebnis zurtickliefern 



Auswertung TSC Statistik 

Die Statistikdatei kann mittels eines Texteditors eingesehen werden oder in ande- 
re Programme importiert werden, da die Datei im CSV-Format vorliegt. 

Auswertung TSC Fehlerprotokoll 

Mittels eines Texteditors kann das Fehlerprotokoll eingesehen werden. 



Rolle 


Aktivitaten 


BRISBA 

NE-SC 

AHmin 


tbd. 



TSC PlattformAnalysemodell 
Use-Case-Diagramm, Grobanalyse 

Fig. 4 beschreibt die groben Zusammenhange der am Recherchensystem (TSC) 
beteiligten Akteure und AnwendungsfSlle. 
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Use-Case: TSC Konfiguration 

* Der fl TSC Admin" erhalt die Moglichkeit, die in einer XML-Datei abgelegte Konfigu- 
ration des Suchcenters einzusehen und zu verandern. Dazu bedient er das Ad- 
min-Tool, das auf einem separaten, nicht zur Produktivumgebung gehorenden 
Rechner lauft. Damit eine geanderte Konfiguration wirksam wird, ist ein Neustart 
der einzelnen Prozesse notwendig. 

Business Process Diagramm 

Die in Fig. 5 schematisch dargestellte Administration des Recherchensystems be- 
inhaltet verschiedene Aktionen. Dazu zahlen die Anderungen der Ausschlussfilter 
und das Aktivieren der Anderungen. Zur Aktivierung wird ein Script angestoRen, 
das die aktuelle Konfiguration auf die Rechner des Produktivsystems kopiert. Im 
Diagramm sind die Rechner des Produktivsystems an der unteren rechten Ecke 
zu sehen. Der Administrator selbst tritt als „worker" auf und erscheint hier links 
oben im Diagramm. 

Use-Case: TSC Ausschlussfilter pflegen 

Der „TSC Filtermanager" pfiegt die Worter, die von der Suche ausgeschlossen 
werden sollen. Diese Worter konnen pro Land (Portal) als auch zeitlich einge- 
schrankt definiert werden. 

Nach Anderung der Ausschlussfilter ist jeweils das Recherchensystem (TSC) 
neuzustarten, damit die Anderungen aktiv werden konnen. 

Use-Case: Konfiguration und Filter aktivieren 

Die Konfiguration wird mit Hilfe des Admin-Tools vom Admin-Rechner auf alle am 
Suchcenter beteiiigten Rechner Qbertragen und dann ein Neustart des Systems 
durchgefuhrt. Durch einen Neustart werden u. a. neue Prozesse gestartet, die 
wahrend ihrer Initialisierung die aktuelle Konfiguration und die Filtertabellen laden. 
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Use-Case: TSC Restart 

* Das Suchcenter wird mit Hilfe des Admin-Tools neu gestartet. Dabei werden alle 
Prozesse auf alien am Suchcenter beteiligten Rechnem geordnet beendet und 
neugestartet. Ein Neustart ist notwendig, damit Anderungen der Ausschlussfilter 
oder der Konfiguration wirksam werden. 

Use-Case: Suchanfrage bearbeiten 

Der „Kunde" glbt In der Suchmaske des Ein-/Ausgabesystems seinen Suchaus- 
druck ein. Dieser kann aus mehreren mit UND-, ODER- und NICHT-Operatoren 
verknQpften Wdrtern bestehen. Dieser Suchausdruck wird nach Absenden an die 
Server-Engine von dieser interpretiert, an die Anforderungen der verschiedenen 
(z. T. externen) Suchmaschinen angepasst und an diese selbst geschickt. Unter 
BerQcksichtigung von konfigurierbaren Timeouts werden die verschiedenen Su- 
chergebnisse dann zu einer Gesamtansicht integriert und zum Browser des Kun- 
den ziirOckgeliefert. 

Use-Case: Auswertung Statistik 

Der „TSC Filtermanager" kann uber einen Texteditor die Suchbegriffe und Verar- 
beitungszeiten einsehen. Zusatzlich sollen dem Auswerter Moglichkeiten bereitge- 
stellt werden, die eine Ad-hoc-Standardauswertung nach noch zu definierenden 
Kriterien erm6glicht. 

Use-Case: Auswertung Fehlerprotokoll 

Der „TSC Admin" kann Qber einen Texteditor die in einer Textdatei abgelegten 
Fehlermelduhgen einsehen. 



Use-Case-Diagramme, Feinanalyse 

In Fig. 6 ist der Ablauf einer Anfrage an die Suchmaschinen schematisch darge- 
stellt. Jnterpretierte Anfrage senden" bearbeitet den eintreffenden Suchauftrag, 
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passt diesen an die Syntax der beteiligten externen Suchmaschinen an und sen- 
* det ihn an diese weiter. 
„Ergebnisse Integrieren" empfangt die Suchergebnisse der Suchmaschinen und 
prSsentiert sie dem Nutzer im gewunschten Format. 

Fig. 7 zeigt schematisch den Ablauf einer verteilten Abfrage mit anschlieliendem 
ZusammenfQhren der Ergebnisse. „Ergebnisse sammeln" akkumuliert die von den 
Suchmaschinen eintreffenden Suchergebnisse. Ein Suchergebnis muss innerhalb 
eines konfigurierbaren Zeitlimits (Timeout) eintreffen. 1st dem nicht so, wird dies 
als Fehler interpretiert. 

Jf ErrorhandIing" Qbernimmt das Protokollieren von Fehlerzustanden in eine Fehler- 
datei. 

w Priorisieren" wichtet die von den verschiedenen Suchmaschinen gelieferten Er- 
gebnisse nach bestimmten GeschSftsregein. 

Fehierbehandelte und priorisierte Suchergebnisse werden Jn Ergebnisseite inte- 
grieren" in das gewunschte Ausgabeformat uberfuhrt 

Der Nutzer/Kunde hat, wie in Fig. 8 dargestellt, zwei Moglichkeiten der Suche. 
Bei „einfach Suchen" kann der Nutzer einen oder mehrere Suchbegriffe und even- 
tual Suchoperatoren eingeben, die der FAST-CGI Syntax entsprechen mussen. 

Bei „erweiterter Suche" kann der Nutzer zuerst den Typ des gesuchten Webin- 
halts auswahlen ( Webseite, Bild, Musik etc.). Je nach Inhaltstyp stehen dann an- 
gepasste Suchoptionen zur Verfugung. 

Der in Fig. 9 schematisch dargestellte Filter oder Interpreter bekommt zusatzlich 
zu den Konfigurationsdaten den aktuellen „query string". Diese Zeichenkette ent- 
halt Parameter und die Suchanfrage des Nutzers. Die Suchanfrage wird entspre- 
chend der Filterregeln des jeweiligen Systems (Suchmaschine) modifiziert. Ein 
weiterer Schritt baut aus den jeweiligen „query strings" und einigen Parametem 
eine komplette URL fur die Suchmaschine. Diese URL ist im o. g. Diagramm als 
„ZieLURL" identifizierbar. 
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Moduluberblick 

Das Gesamtsystem unterteilt sich, wie in Fig. 10 gezeigt, im wesentlichen in drei 
Module. Diese werden im Folgenden naher beschrieben. In Interpreter und Inte- 
grator existieren Adapterklassen, die jeweils auf genau ein Zielsystem zugeschnit- 
ten sind. Alle Adapterklassen besitzen einen statischen und einen dynamischen 
Teil. Der statische Teil wird durch Konfigurationsdaten reprasentiert. Der dynami- 
sche Teil hangt von der jeweiligen Suchanfrage ab. 



Modul Interpreter 

Das Modul BRISBANE-lnterpreter enthalt, wie in Fig. 1 1 gezeigt, Klassen, die der 
Filterung und sonstiger Aufbereitung der Suchanfragen dienen. Allgemein kann 
man sagen, dass der Interpreter die Basisdaten fur den Integrator bereitstellt. Die 
Funktionalitat der Filterung ist stark vom Zielsystem (Suchmaschine) abhangig 
und verbirgt sich in den entsprechenden Adapterklassen. 



Modul Integrator 

Die in Fig. 12 gezeigten Klassen im Modul Integrator sind verantwortlich fur Wei- 
terleitung der modifizierten Suchanfragen an die Zielsysteme. Weitere Aufgaben 
des Integrators sind das Zusammenstellen der Suchergebnisse und deren Kon- 
vertierung von XML in HTML, das Darstellen der Ergebnisseite, sowie die Bereit- 
stellung der Statistikdaten. 



Fur jede Anfrage an ein Zielsystem wird eine Instanz der Klasse Request erzeugt. 
Diese Objekte stellen die Kommunikationsschnittstelle zwischen Suchcenter und 
Zielsystemen dar. 

Die Kommunikation mit den Zielsystemen wird durch den RequestManager ver- 
waltet. Er ist jedoch nicht fUr die Darstellung der Ergebnisse verantwortlich. 
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Modul Server-Engine 

* Dieses in Fig. 13 anhand seiner Klassen gezeigte Modul reprasentiert den Haupt- 
prozess des Suchcenters. Er besitzt eine Instanz der Klasse Configuration", die 
den Zugriff auf alle Konfigurationsdaten ermoglicht. Innerhalb des Prozesses wer- 
den Konfigurationsdaten in unterschiedlichen Strukturen wie z. B. AdapterMap 
abgelegt 

Die Server-Engine ist auch fur das Instanziieren von Interpreter und Integrator so- 
wie das geordnete Beenden des Prozesse ( bei Eintreffen eines Signals) verant- 
wortlich. 

Die Klasse Logging ist fur die Protokollierung von Fehlern und Statistikdaten ver- 
antwortlich. 

Dynamisches Modell 

In Fig. 14 ist das dynamische Verhalten der einzelnen Komponenten und der In- 
formationsfluss zwischen ihnen dargestellt. 

Nach dem Start der Suchcenter-Software wird die Konfiguration ausgelesen. Je 
nach Konfiguration werden dann entsprechende Ausschiussfilter und eine lander- 
spezifische XSL-Datei geladen. Der Prozess wartet nun auf eine Suchanfrage. 
Wenn diese eintrifft, wird der Suchausdruck interpretiert. In Ausschlussfiltern vor- 
kommende Wcirter werden aus der Suchanfrage entfernt. Zusatzlich wird die An- 
frage an die Syntax der beteiligten Suchmaschinen angepasst. Die modifizierten 
Suchausdrucke werden nun an die Suchmaschinen gesendet. Abhangig vom 
Format der zurOckgelieferten Ergebnisse ist eventuel! eine Transformation in das 
HTML- Format notwendig (wenn beispielsweise die Ergebnisse im XML- Format 
vorliegen). Die Ergebnisse werden an den Browser des Kunden gesendet. 
Der Prozess geht wieder in Warteposition, bis der nachste Request eintrifft. 
Die einzelnen Suchanfragen werden mit Suchausdruck, Zeitstempel und Dauer 
der Verarbeitung in der Statistikdatei „tsc_statistics" abgelegt. Zudem werden 
Fehlerzustande wahrend des gesamten Verlaufs in der Datei „tsc_errorJog" ein- 
getragen. 
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Modul Server Engine 
Initialisierungsphase 

Wahrend der Initialisierung werden, wie in Fig. 15 gezeigt, abhangig von aktiven 
Kanalen, Konfigurationsobjekte und Instanzen alter Adapter erzeugt. Die Kanale 
entsprechen den vorher angesprochenen Channels und reprasentieren ein ganz 
bestimmtes Zielsystem. 

Verarbeitung einer Suchanfrage 

Bei Eintreffen eines Requests werden, wie in Fig. 16 dargestellt, Instanzen von 
Interpreter und Integrator angelegt. Alle notwendigen Informationen fur die Intan- 
zen werden von der Server-Engine bereitgestellt. Der Interpreter bereitet nun die 
Modifikationen der Suchanfrage vor, der Integrator sendet diese an die Zielsyste- 
me und liefert die formatierten Suchergebnisse zuriick. Die Instanzen von Inter- 
14 preter und Integrator werden anschlieliend zerstdrt. 

15 

is Modul Interpreter 



11 

12 
13 



17 
18 



22 
23 



25 
26 



Der Interpreter veranlasst„wie in Fig. 17 gezeigt, alle fur den Request bendtigten 
Adapter, jeweils ein AdapterResult zu erzeugen. Jeder einzelne Adapter modifi- 
ziert die originate Suchanfrage unter Zuhilfenahme der entsprechenden Filterre- 
geln. Diese Suchanfrage und weitere Parameter sind f(ir das Erzeugen eines Ad- 
apterResult-Objektes notwendig. Das erzeugte AdapterResult-Objekt wird dem 
Interpreter zurtickgegeben, deres einer Liste hinzufQgt. 



24 Modul Integrator 



Nach Erzeugung der Integrator-lnstanz befindet diese sich in einem initialen Zu- 
stand. Die Verarbeitung der Requests erfolgt durch den Aufruf der Methode „do- 
27 Requests()". 



28 



(NMhnP030300DE.doc) letzle Speleherung: 25. Marz 2003 



Patentanwaite Tergau & Pohl, NQrnberg 

Seite 26 

» Main des fast- Programms 

• Das Fast-CGI Programm enthalt eine Funktion „main()". Dieses wird vom Webser- 
ver aufgerufen. Voraussetzung fQr das ordnungsgemalie Arbeiten des Programms 
ist die korrekte initialisierung und das Eintreten in die Warteschleife. Die Konfigu- 
ration wird in einer Datei gehalten. Die Angabe des kompletten Pfades dieser Da- 
tei erfolgt Qber eine Umgebungsvariable. 

Konfiguration des Recherchensystem 

Das Suchcenter wird Qber eine einzige Datei konfiguriert (tsc.cfg). Diese Datei be- 
findet sich auf einem separaten Rechner, der nicht als Produktivrechner verwen- 
det wird. Die Konfigurationsdatei dient als Vorlage fur alle Konfigurationsdateien 
pro Rechner in der Produktionsumgebung. Bei Anderungen der Konfiguration 
(z. B.: Modifikation des Verzeichnisses fur die Statistikdateien) wird die Konfigura- 
tionsdatei auf dem auBerhalb des Produktivsystems befindlichen Rechner modifi- 
ziert und per Script auf alle Rechner im Produktivsystem kopiert. 

Format der Filtertabelle 

Auf Anforderung im Admintool wird aus der Datenbank (mysql) eine aktuelle Fil- 
terdatei erstellt, die Qber die Verteilmechanismen an die Suchcenter-Rechner 
ubertragen wird. 

Diese Filterdatei hat zeilenweise Eintrage, innerhalb einer Zeile sind die Werte 
durch Semikolon getrennt. 

Eine Zeile ist folgendermaGen sematisch aufgebaut (Werte in Q sind optional:): 
Landercode; zu filtemdes Wort oder Phrase; [Datum Beginn]; Uhrzeit Be- 
ginn; [Datum Ende]; Uhrzeit Ende; Kanal 1; Kanal 2; ...;Kanal n 

z. B. 

DE;Neu;2000-10-10;12:00:00;2001-12-31;23:35:00;WWW;;;;; 
DE;verboten;2001 -1 0-20;01 :00:00;2001 -1 2- 

31;20:00:00;WWW;P4P;BRISBANE;PHP;SP;AD 
UK;Bier;;00:00:00;;00:00:00;WWW;;BRISBANE;;SP; 
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CH;Alkohol;2001-09-30;15:00:00;;00:00:00;WWW;;BRISBANE;PHP;; 
Aktivierung von Konfiguration und Filtertabelle 

Die Aktivierung von Konfiguration und Filtertabelle erfolgt durch das Starten von 
Scripts. 

Format der Protokolldatei 

Der Name der Statistikdatei wird in der Konfigurationsdatei (tsc.cfg) angegeben, 
z. B. tsc_statistics_<PID>. <PID> wird dann im Betrieb durch die Prozess-ID er- 
setzt. Da gleichzeitig mehrere Prozesse laufen, gibt es auch dementsprechend 
viele ProtokoIIdateien. 

Alle Statistikdateien liegen in einem zentralen Verzeichnis. 

Diese Statistik-Dateien werden im CSV-Format gespeichert. Zur Auswertung exi- 

stiert ein separater Prozess, der aufgrund des grofcen Datenvolumens auf einem 

eigens daftir eingerichteten Server laufen sollte. Die Such-Prozesse schreiben 

entweder ihre Daten direkt auf den Auswertungsserver Oder der Auswertungspro- 

zess sammelt in regelmaliigen Abstanden die Statistik-Daten aller Such-Prozesse 

ein. 

Aufbau der Datei 

Die Statistik-Datei besteht aus 4 Grundspalten und pro realem Kanal kommen 
weitere 4 Spalten hinzu. 

Grundspalten: 



2. 



1. 



Eingegebene Suchbegriffe 
Uhrzeit der Suche 



3. 



Suchmodus 



4. 



Gesamtzeit in ms oder Timeout 
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- Spalten pro Kanal: 



1. 



Name 



4. 



2. 



3. 



verwendete Suchbegriffe 
Zeitdauer in ms oder Timeout 
Anzahl der Ergebnisse 



Mengengertist 

Grundspalten ca. 50 Byte 
Kanalspalten je ca. 50 Byte 

Maximallast 500 Anfragen pro Sekunden, ca. 250 Byte pro Anfrage: 

125 KByte pro Sekunde ^ 450 MByte pro Stunde -> 10,8 GByte pro Tag 

Format der Fehlerprotokollierung 

Der Name der Fehlerprotokolldatei wird in der Konfigurationsdatei (tsc.cfg) ange- 
geben, z. B. tsc_err_<PID>. <PID> wird dann im Betrieb durch die Prozess-ID er- 
setzt. Da gleichzeitig mehrere Prozesse laufen, gibt es auch dementsprechend 
viele Fehlerprotokolldateien. 

Eintrage in das Fehlerprotokoll geschehen zeilenweise. Innerhalb eines Eintrages 
sind die Werte kommasepariert und hat folgende sematische Bedeutung 
Uhrzeit, Original-URL, angepasste URL, Zeit fur den reinen Request, Anzahl 
Treffer, Beschreibung des aufgetretenen Fehlers 

z. B.: 

12.10.2001 09:41 :35,http://192.168.70.42:80/fast- 

cgi/ubrtsc?lang=any&q^est&start=0&num=10&context=wftw&type=all&Port 
alLan- 

guage=de&context=www,http://66.77.74.21:8075/max_xml_b00?hits=10&q 
uery=test&offset=0,HTTP-Call:145 ms.Total Hits:15737604,ERROR in 
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Brisbanelntegrator::getQueryResults() 'ghttp _process () failed.Error: 
getQueryResults 

Wenn ein allgemeiner Fehler auftritt, wird dieser in der Form, Uhrzeit, Beschrei- 
bung des aufgetretenen Fehlers protokolliert, z. B. 

12.10.2001 09:41 :35,ERROR in Brisbanelntegrator::initXSLT() 'mpXMLStyleptr: 
xmlParseMemory error'.Error: can't initialize xslt-process. Process Exit 

Beschreibung der Stylesheets 

Die XSL-Stylesheets dienen innerhalb des Suchcenters dazu, die gesammelten 
Antworten in XML-Form zu einer HTML-Seite entsprechend der aktuellen Layout- 
vorgaben umzusetzen. Die Daten fur eine Webseite werden dem Stylesheet im 
XML, bzw. durch Stylesheetparameter Obergeben. Pro Sprache existiert im Such- 
center ein Stylesheet. Innerhalb des Stylesheets werden die Suchergebnisse in 
HTML aufbereitet sowie die Links fur das Vor- und Zuruckblattern erzeugt. Ent- 
sprechend den Voreinstellungen wird dann noch die entsprechende Reiterstruktur 
Qber den Suchergebnissen und die Werbebanner bzw. die Formular fur die neue 
Suche erstellt. 



Administration der Filtertabelie 



Kontext 

Der Kontext der Admin Anwendung ist in Fig. 18 dargestellt. 
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Zusammenfassung 

Ein Recherchensystem und ein Verfahren zur Ermittlung von Informationen aus 
einer Datenbank, insbesondere aus dem World-Wide-Web, sollen zur Erzielung 
von gleichbleibend hohen Recherchequalitaten in besonderem Mafce geeignet 
sein. Dazu ist erfindungsgemafc die gemeinsame und/oder gleichzeitige Nutzung 
einer Mehrzahl von Suchmaschinen (2) vorgesehen, wobei in einem Integrations- 
modul (6), das die von den Suchmaschinen (2) gelieferten, jeweils eine Mehrzahl 
von Ergebnisdatensatzen (E) umfassenden Ergebnisdaten in ein gemeinsames 
Datenformat konvertiert, unter Ruckgriff auf in einem Speichermodul (14) hinter- 
legte Priorisierungsparameter (P) die Zuordnung eines Relevanzkennwerts zu je- 
dem Ergebnisdatensatz (E) vorgesehen ist. 

Fig. 1 
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Bezugszeichenliste 



1 Recherchensystem 

2 Suchmaschinen 

4 zentrale Auswerteeinheit 

6 Integrationsmodul 

8 Speichermodul 

1 0 Distributionsmodul 

12 Pufferspeicher 

14 Speichermodul 

1 6 Filtermodul 

18 EirWAusgabemodul 

20 Werbemitteldatenbank 

E Ergebnisdatensatze 

P Priorisierungsparameter 
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